查看原文
其他

循证公益 02 | 循证的定义、历史及应用

沃启 沃启基金会 2022-11-27

循证(EBP)是一个很大的概念,具体到各个学科领域,又会衍生出很多定义和概念,译介系列希望通过翻译相关英文文献,并结合一些中文资料,对循证这一概念以及这一概念在各个领域的应用做一个相对直观的呈现。对于循证这一概念本身,维基百科有很好的综合性阐释,因此作为我们系列译文的第一篇,我们也对维基百科相关词条做了一些选择性和摘要式的翻译,期望读者能对循证的概念、历史、证据等级,以及相关应用领域等有一个大概的了解。


循证的内涵


循证实践(Evidence-based practice,简称EBP)意指职业实践应基于科学证据。自1992年正式引入循证医学以来,循证逐渐深入人心,并普及至专职医护行业,教育,管理,法律,公共政策和其他领域。鉴于研究显示科学研究中存在的问题(例如可重复危机),出现了将循证实践应用于科学研究本身的运动。基于证据的科学研究被称为元科学。对科学研究进行评估极其复杂,循证实践将从科学研究中所获得结果的相对强度进行排序,也称为证据等级。研究设计和衡量目标(如生存率或生活质量)都会影响证据的强度。通常,系统评价和元分析排在等级顶端,而随机对照试验排在观察性研究之上,专家意见和案例报告排在底端。对于不同类型研究的相对强度有着广泛的共识,但是没有一个单一的、普遍接受的证据等级。目前已有80多个不同的等级来评估医学证据。


循证是一种与传统相对立的哲学方法。几乎每一个行业都对“一贯做法” 存在某种程度上的依赖,即使这些做法与时下更优质的信息相矛盾。循证的发展试图鼓励,在某些情况下也迫使专业人士和其他决策者更多地关注证据,以提供决策的依据。循证的目标是通过把决策的基础从传统,直觉和非系统性的经验转移到坚实的科学研究,来消除不合理或过时的做法,从而采用更有效的实践。


一些评论家认为,由于研究是在人群基础上进行的,结果可能无法推广到每一个人。因此,循证实践可能无法为每个人提供最佳解决方案,而传统实践可能更好地适应个体差异。对此,研究人员也做了一些努力,如测试特定的实践是否对不同的亚文化、人格类型等会更有效。一些研究者也在尝试重新定义循证学,将共同智慧、传统和个人价值观与基于证据的实践结合起来。


循证的历史


在历史上,大多数时候专业人士的实践都基于所继承的传统经验。这些传统经验很多没有证据支持,这也导致产生了一些低劣和滥竽充数的行为。即使不存在明显的欺骗行为,传统做法的质量和效率也可能不是最优的。随着科学方法逐渐成为可靠的评估手段,循证也得到越来越多的采用。


循证最早的支持者之一是一位流行病学家,阿尔奇·科克伦(Archie Cochrane),他在1972年写就了《有效性和效率:医疗服务杂想》一书。在该书中,科克伦主张合理测试医疗保健策略,这也是循证医学的基础。由于资源总是有限的,因此这些资源应提供给在评估中显示最有效的医疗保健形式。科克伦坚信最可靠的证据来自随机对照试验。


“循证医学”一词由戈登·盖亚特(Gordon Guyatt)于1990年在一份未发表的项目说明中提出,该词后来在1992年首次发表。这也是第一个正式建立的循证实践。循证医学的一些早期实验涉及测试放血等原始医疗技术,以及研究现代公认的治疗方法的有效性。保险供应商一直在推动循证医学的发展,他们有时拒绝为缺乏系统的有效证据的医疗实践提供保险。现今大多数客户都希望医疗专业人员根据科学证据作出决策,并及时告知最新信息。自循证医学被广泛采用以来,循证的应用迅速扩展到其他领域。


近年来,也出现了一股推动循证教育的力量,运用有科学基础的学习技巧,如曲线记忆法,来提高学生的学习率。一些人认为,教育领域普遍缺乏显著进展,因为实践停留在成千上万个教师互不关联的和非累积性的经验中,每一位教师都在重复他人的实践,无法从确凿的科学证据中学习到什么才是“行之有效”。反对这一观点的人认为,教育领域并不适用严格的科学证据;知道一种药物有效(在医学中)与知道一种教学方法有效完全不同,因为后者将取决于一系列因素,尤其是那些与教师的风格、个性和信仰以及特定学生的需要有关的因素。一些反对循证教育的人认为,教师需要发展自己的个人实践,通过自己的经验获得个人的知识。还有人认为,教师个人实践必须与研究证据相结合,但不能将后者视为特殊来源。这与一个学派的观点一致,该学派认为循证实践有局限性,知证实践(EIP)更优。知证实践使用定量证据,摒弃非科学的偏见,但也包括定性因素,如一线经验以及从业者和服务对象的洞察。


循证的应用


(1)元科学/循证研究(Metascience/Evidence-based Research


一直以来,研究领域都有运用循证实践进行科学研究的运动,试图解决可重复危机和其他影响科学研究的重大问题。将循证应用于研究本身被称为元科学,它旨在提高科学研究的质量,同时减少资源浪费。它也被称为“研究中的研究”和“科学中的科学”,因为它使用研究方法来研究研究本身是如何进行的以及在哪些地方可以改进。元科学研究的五个主要领域是方法论、报告、再现性、评估和研究动机。元科学已经在科学领域进行了一些改革,例如使用研究预注册和使用报告指南来优化科研实践。


(2)循证政策(Evidence-based Policy)


循证政策是公共政策中的一种理念,它提倡政策决策应以严格确立的客观证据为基础或依据。这里隐含的对比是基于意识形态或“常识”的决策。也有人认为,当严格而全面地使用科学证据为决策提供信息,而不是以零碎的、被操纵的或精心挑选的证据时,可以最好地实现社会目标。循证政策源于20世纪80年代循证医学的兴起所引发的循证运动,然而,关于循证政策仍然存在争议。


有些人提倡特定类型的证据是决策者考虑的“最佳”证据,包括科学严谨的评估研究,如随机对照试验可以确定哪些计划和实践有利于政策推动的结果。然而,定量研究不能很好地为某些与政策相关的知识领域服务,从而引发了对收集证据而言至关重要的方法和工具的争论。例如,与人权、公众接受度或社会正义有关的政策可能需要随机试验提供的证据以外的其他证据,或者除了考虑干预效果的证据(主要通过设计随机试验来提供)之外,还可能需要道德和哲学层面的论据。因此,良好的数据、分析能力和对使用科学信息的政治支持通常是循证方法的重要组成部分。


现在,一些政策学者避免使用循证政策这一术语,而使用其他术语,如知证政策。这种语言的转变使我们不断思考大家是否有一种潜在的期望,即如何在严谨性或质量方面提升证据的使用,同时避免循证语境下的一些关键限制或简化思想。不过,循证政策一词仍得到了广泛的使用,这也可以理解为大家的另一种期望——不管何种情况,证据都要得到合理和正确的使用——比如系统地考虑严谨而高质量的政策相关证据,或避免出于政治目的有偏见地、错误地使用证据。


(3)循证管理(Evidence-based Management


循证管理(EBMgt)在管理和决策中明确使用目前最好的证据,是一个新兴的运动,也是更大的循证运动的一部分。


体现循证组织文化的实践包括:组织数据的系统积累和分析;以问题为基础的阅读和研究概要探讨;以及根据最有效的研究和组织信息作出决策。


在产品开发中比较变通的组织经常发现,要最大程度地发挥变化带来的好处就必须在整体上建立变革的机制。循证管理提供了一种条理清晰的方法,通过将投资重点放在最快带来最大价值的领域,并提供评估其成功的框架,帮助组织在短期内进行变革。


一些循证管理的倡导者认为,循证管理更可能被知识密集型组织采用。一项对六家主要医疗机构的研究发现,管理者和临床带头人利用了多种知识形式,包括从学术研究、经验知识和德高望重的同事身上汲取知识。研究人员总结道,在特定的组织环境中,娴熟的“知识型领导力”对于积极调动相关方式将循证管理和其他学术研究转化为实践至关重要。


(4)循证评价(Evidence-based Assessment


循证评价(EBA)是指使用研究和理论来指导选择用于特定评价目的的框架,并提供评价过程中使用的方法和衡量标准。它涉及以下认识:即使有心理测量学强有力的测量数据,评价过程本质上是决策过程,临床医生必须通过整合一致但常常是不完整的数据来反复构想和检验假设。研究发现,循证评价可以帮助临床医生纠正其在临床决策时的认知偏差。循证评价是朝着循证实践发展的重要一步。


循证评价最早出现在医学领域,随后被引入其他领域,特别是临床心理学。循证评价方法被广泛认为是一种实践驱动的临床决策方法,《科克伦系统综述数据库》也有关于循证评价方法有效性的报告。


(5)影响评估(Impact Evaluation)


影响评估旨在评价因特定干预措施(如项目、计划或政策)带来的变化,包括预期的变化,以及理想情况下的非预期变化。与监测结果来调查目标是否达成不同,影响评估的结构是回答以下问题:如果不进行干预,参与者的幸福感等结果会发生变化吗?这其中包含了反事实分析,即“实际发生的情况与无干预下本应发生的情况之间的比较。”影响评估旨在回答因果问题。换句话说,它们寻找直接归因于某个项目的结果变化。


影响评估有助于人们回答循证政策制定背后的关键问题:什么有效,什么无效,在哪里有效,为什么有效和有效性多少?近年来,在发达国家和发展中国家的决策过程中,影响评估受到越来越多的关注。它是评估工具库和方法库的重要组成部分,对提高国际援助有效性和改善生活水平的公共支出有效性来说必不可少。最初影响评估更多地被用于评估发展中国家的社会部门方案,尤其是附条件现金转移方面,现在则越来越多地应用于农业、能源和运输等其他领域。


(6)有效利他/循证慈善(Effective Altruism/ Evidence-based Philanthropy


有效利他主义是一种哲学和社会运动,主张利用证据和推理来确定最有效的方式来造福他人。与只强调自身利益的利己主义相反,利他主义是指改善他人的生活。与只做有些益处的事相反,有效指的是用任何可用的资源做最有益的事,同时有效利他通过使用证据和推理来确定什么是最有益的事,而不是只做感觉良好或直觉上看起来有吸引力的事。


信奉有效利他主义的人通常被称为有效利他主义者。虽然许多有效利他主义者关注的是非营利部门,但有效利他主义的理念有更广泛的适用空间,可以用于确定科学项目、商业公司及政策倡议的优先次序,帮助扶贫济困、拯救生命或以其他方式将效益最大化。


  • 目标优先级


许多非营利组织强调有效性和证据,但通常只考虑一个目标(或问题),如教育或气候变化。然而,有效利他主义者试图比较不同目标的相对重要性,并客观地分配资源,这个概念通常被称为目标中立。举例来说,目标中立的方法是根据每个目标领域的活动是否能够有效地促进更广泛的目标,如提高人类或动物福祉,然后集中力量在优先目标领域的干预措施上。


确定目标优先顺序所需的信息有时候会比较难收集,它可能涉及收集和处理复杂的数据集,将可能的结果与在其他条件下发生的情况进行比较(见下文反事实推理),并识别各种不确定性。这些挑战催生了专门研究目标相对优先顺序的组织。其中,有效利他主义者的共同优先目标领域包括发展中国家的贫困问题、工业化农场动物的遭遇问题以及对整个文明、人类和地球的各种威胁。


  • 成本效益


有效利他组织认为,有些慈善机构的效率远远高于其他慈善机构,因为有些慈善机构没能实现其目标,或者因为实现这些目标的成本存在差异。他们会尽可能找到那些具有高成本效益的慈善机构,即投入同样的金额获得了更大的效益。例如,他们根据影响的多少来选择健康干预措施,以每1美元可挽救的生命、每1美元可获得的高质量生命年(QALY)或每1美元可避免的伤残生命年(DALY)来衡量。这种度量方式将疾病负担表示为因健康问题、残疾或早逝而损失的年份。


一些有效利他组织使用随机对照试验作为主要的证据,因为它们通常被认为是医疗保健研究中最高水准的有力证据。但也有人认为,使用这种高等级的证据会不必要地将焦点缩小到只有此类证据可能存在的问题上,慈善事业的历史也表明,最有效的干预措施往往是在没有这种级别证据的情况下进行的。


  • 筹措更多资金的空间


有效利他组织会根据资助的边际效用为慈善机构提出慈善建议,而非仅仅评估对慈善机构捐赠带来的平均价值。有效利他主义者会避免向那些没有“更多筹措资金空间”的组织捐款——这些组织除了金钱以外还面临其他瓶颈,妨碍他们使用已有或即将获得的资金。例如,一家医疗慈善机构虽然有能力购买足够的医疗用品,或已经有能力服务当地所有的潜在患者,但可能无法雇用足够的医生或护士。还有许多其他组织确实有更多的资助空间,因此,为这些组织提供资金会带来实际的改善。


  • 反事实推理(Counterfactual Reasoning)


有效利他主义者认为,反事实推理对于确定哪种行动方案能最大限度地发挥积极影响非常重要。许多人认为,通过直接的方式帮助他人是最好的,比如为慈善机构工作或提供社会服务,但由于慈善机构和社会服务提供方通常可以找到愿意为它们工作的人,因此,有效利他主义者会把一个人在传统利他职业中所做的善事量与如果雇佣次佳的候选人所做的善事量进行比较。根据这个推论,职业产生的影响可能比表面上看起来要少。


本文主要译自维基词条Evidence-based practice,同时也参考了其他词条,如Evidence-based_management,Evidence-based Assessment, Impact evaluation, Hierarchy of Evidence,Effective altruism等。文章内容具体来源请参见:https://en.wikipedia.org/。如需转载或作其他用途,请注明出处。



编辑 | 吴伟明

排版 | 汪   璟

审校 | 付   涛

图源 | 觅元素



项目执行方

项目资助方


一分钟

了解我们

沃启基金会致力于通过知识生产、研究、咨询和传播,协同和支持社会组织提升专业化水平,推动有效公益,助益社会生态的包容多元和可持续发展。沃启基金会目前有三个业务方向(公益知识积累、梳理和传播;公益导航研究和生态圈建设;公益人才赋能与发展)和一个垂直议题:垃圾分类与可持续社区发展。

欢迎扫码关注!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存